Top des produits IA

Top des produits IA

Recherchez la dynamique mondiale des produits IA

Recherchez des informations sur l'IA mondiale et découvrez de nouvelles opportunités d'IA

Actualités
Applications de produits
Études de monétisation
Tutoriels IA

Type :

Actualités
Applications de produits
Études de monétisation
Tutoriels IA

2025-01-16 10:42:26.AIbase

L'équipe Qwen d'Alibaba publie un nouveau modèle de récompense de processus, faisant évoluer le raisonnement mathématique

L'équipe Qwen d'Alibaba a récemment publié un article intitulé « Leçons apprises sur le développement d'un modèle de récompense de processus pour le raisonnement mathématique » et a présenté deux nouveaux modèles de la série Qwen2.5-Math-PRM, avec 7B et 72B paramètres respectivement. Ces modèles dépassent les limites des frameworks PRM existants en matière de raisonnement mathématique, améliorant considérablement la précision et les capacités de généralisation des modèles de raisonnement grâce à des techniques innovantes. Le raisonnement mathématique représente un défi majeur pour les grands modèles de langage (LLM), en particulier dans les étapes intermédiaires du raisonnement, où des erreurs...

L'équipe Qwen d'Alibaba publie un nouveau modèle de récompense de processus, faisant évoluer le raisonnement mathématique

2024-09-13 08:35:31.AIbase

Kunlun Wanwei lance Skywork-Reward, un nouveau modèle de récompense pour les grands modèles linguistiques

Kunlun Wanwei, société cotée en bourse, a récemment annoncé que ses deux nouveaux modèles de récompense, Skywork-Reward-Gemma-2-27B et Skywork-Reward-Llama-3.1-8B, ont obtenu d'excellents résultats sur RewardBench, une référence internationale d'évaluation des modèles de récompense. Le modèle Skywork-Reward-Gemma-2-27B a même obtenu la première place et a reçu les félicitations officielles de RewardBench.

Kunlun Wanwei lance Skywork-Reward, un nouveau modèle de récompense pour les grands modèles linguistiques